VERGEET DE GIDS NIET 


Bezoek sites die al lang verwijderd zijn 


Terug naar de 
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internet-oertijd 


We staan er van te kijken hoe eenvoudig onze eigen Clickx-site er 10 jaar 
geleden uitzag. Eens temeer merk je dat 10 jaar een eeuwigheid is in de 
internetwereld. Maar kan je dan websites bekijken die allang gewijzigd of 
zelfs verwijderd zijn? Jazeker, welkom in de tijdmachine! 4 orx scuoors 


WAT DOEN WE? 


WAARMEE? 


HOELANG? 


MOEILIJKHEID? 
heete liet 


nl ebsites steek je af en toe eens in een ander 
kleedje. Als er één ding is waarin websites 
verschillen van andere documenten, dan is het dat 
veranderende karakter. Zeker met de huidige con- 
tent management-systemen is je website aanpassen 
een fluitje van een cent. Tenzij je ergens op een 
harde schijf een back-up kan raadplegen, lijkt het 
onmogelijk om terug te gaan in de tijd. Maar niets 
is minder waar. 


De begindagen van Clickx 


Laat het ons meteen bewijzen. Ziehier de homepage 
van Clickx op 13 juli 1997 (zie afbeelding 1). Je tovert 
deze webpagina uit vervlogen tijden via een tussenstapje opnieuw op 
je scherm. 

Surf naar Archive.org Geef in het zoekvak 
in en klik op de Take Me Back-knop. Als resultaat krijg je per jaar te 
zien op welke data er een momentopname van de gezochte site in de 
archieven staat. Je moet wel even geduld hebben, want het inladen 
heeft zijn tijd nodig. 

Als we bijvoorbeeld de homepage van Clickx.be van 14 januari 2007 
oproepen, werken zelfs de koppelingen. We kunnen de pagina’s een voor 
een openen. Af en toe zijn er hier en daar kleine grafische elementen 


Clickx verschijnt schoorvoetend op het internet. 
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WAAR ZIJN AL DIE VERWIJDERDE SITES NAARGE ? 


Clickx 


zondag, 14 januari 2007 


Software op de juiste manier verwijderen 


k Moe kan je er zeker van zijn dat software ook 
Poons || echt verdmijnk na verwijdering? 


Gecrashta programma's afsluiten 


Vastgelopen programma's kan je op een normale manier sluiten 
zonder je hele systaam opninuw te moeten opstarten. 


Maak je oon screenshot van een video de op je oc aan het 

a} Afspelen is, dan krijg je quasi atijd een zwart scherm als resultaat. Moe komt 
dat, en hoe los je dat op? 

Meer» 


In het adresvak lezen we hoe de webpagina's rechtstreeks van de Archive.org-servers 


laden. 


die tegenpruttelen, maar in de adresbalk van onze browser lezen we 
duidelijk dat we de Clickx-pagina’s rechtstreeks van de Archive.org- 
servers inladen (zie afbeelding 2). Heel sterk! Hoe verder we terug gaan 
in de tijd, hoe moeilijker het wordt om van de homepage door te klik- 
ken naar de inhoud van de website. 

Op die manier kan je bijvoorbeeld zien hoe websites zoals Vlaanderen. 
be of Google zich ontwikkeld hebben. Van de oudste websites (circa 1996 
— 1998) zijn vaak slechts enkele pagina’s aanwezig, maar de nieuwere 
websites zijn vollediger. Sinds 2005 is het mogelijk om zelf websites toe 


te voegen aan The Internet Archive, via Archive-It 


The Internet Archive 


Archive.org is een grootschalig project, ontwikkeld door de Ameri- 
kaanse computerprogrammeur Brewster Kahle. Sinds de zomer van 
1996, de oertijd dus, archiveren ze hier het internet; dus niet alleen 
de homepages, maar ook de nieuwsgroepen. Archive.org maakt gebruik 
van zogeheten web crawling robots, zeg maar programma's die via het 
internet links op websites opzoeken om ze dan in hun geheel te down- 
loaden. Het is wel niet mogelijk om alle websites te kopiëren. Websites 
die beschermd zijn tegen kopiëren, worden niet opgenomen in The 
Internet Archive. 
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Welkom in The Wayback Machine! 


Ondertussen heeft de tijd ook niet stilgestaan voor Archive.org. Sinds 
kort is het project geherstructureerd en werd er een zoekmachine aan 
toegevoegd: The Wayback Machine (zie afbeelding 3). Het archief bevat 
ondertussen 2 pentabytes aan data en groeit nog steeds met 20 terabytes 
per maand. 1 terabyte is 1.024 gigabytes, 1 pentabyte is 1.024 terabytes. 
Om je een idee te geven: de Amerikaanse Library of Congress telt 20 
miljoen boeken, die digitaal 20 terabytes innemen. Deze grootste online 
database ter wereld draait op 400 Linux-machines, aangesloten in een 


enorme keten. Kijk maar eens opf www.archive.org/web/hardware.php 


Help, ik wil onderduiken! 


Leuk, tenzij het gaat om informatie die je destijds opgelucht hebt gewist. 
We weten dat het soms maanden kan duren voordat Google haar indexen 
vernieuwt. Concreet betekent dit dat wie bijvoorbeeld een advertentie 
plaatst, kan meemaken dat deze zoekmachine het bericht maanden later 
blijft bovenhalen, zelfs als het al lang verwijderd is. Met Archive.org loop 
je het gevaar dat de verwijderde informatie jarenlang beschikbaar blijft. 
Wil je je eigen webpagina's uit deze archieven laten verwijderen, dan vind 
je alle informatie op 

Zelfs homepages die op bevel van de rechtbank zijn verwijderd, blijven 
op die manier online zonder dat de eigenaar enige schuld treft. Louter 
uit technische interesse en zonder hiermee enige sympathie voor po- 
litieke of ethische standpunten in te nemen, vonden we op Archive.org 
probleemloos de webpagina's die onze Belgische justitie met een his- 
torische dwangsom heeft laten verwijderen. Op 4 december 2006 be- 
sliste de kortgedingrechter uit Kortrijk om de inhoud van de Vlaams 
Blok-site met een dwangsom van 240.000 euro per dag 
te laten verwijderen. De rechter heeft echter geen rekening gehouden 
met Archive.org (zie afbeelding 4). 
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Mensen en dingen (zoals deze site) hüer om dit te begrijpen 


240.000 euro per dag om deze pagina, die nog steeds op The Internet 
Archive staat, te laten verdwijnen. 


Archiefcollecties 
De samenwerking tussen Archive.org kn Webarchivist.org http://web- 


archivst.org (de universiteit van Washington) heeft enkele mooie archief- 
collecties opgeleverd. Een archiefcollectie is een verzameling gearchi- 
veerde sites rond een bepaald thema. Bijzonder interessant is de 
collectie Web Pioneers web.archive.org/collections/pioneers.html. Hier wor- 
den een handvol websites gepubliceerd — in hun eigen tijd — die een 
belangrijke rol hebben gespeeld in de ontwikkeling van het internet. 
Bezoek bij de pioniers bijvoorbeeld Jerry's Guide to the World Wide Web 
uit 1994. Het initiatief van deze jongens uit de Stanford-campus zou 
later de wereld veroveren onder de naam Yahoo! (zie afbeelding 5). Of 
raadpleeg de Internet Movie Database in de tijd dat Brooke Shields nog 
Brenda Starr speelde. Ook bij de websites van het Witte Huis, Amazon 
en Ultimate Band List kan je terugflitsen naar vervlogen tijden. 

Een ander voorbeeld is het Asian Tsunami Webarchive 
dat meer dan 1.500 websites groepeert over de tsunamiramp 
in december 2004. En The Library of Congress heeft het Minerva Web 
Preservation Project op poten gezet, dat het September 11 Web Archive 


ttp://lcweb4.loc.gov/911/index.html| verzamelde. Dit Minerva-project omvat 


30.000 websites over de aanslag op de Twin Towers. 


@s amet e 9 


Ln | 
Get Lee  Boaamirernaln he, Weekly Picks 


dew) Opens 
chan Pages Prog Seam « CEY Maps — Sch Oeetes « Spaan Seca 


e Arts and Humanities - Architecture, Photogragèy, Literaar… 


« Busincm and Econemy (Xtra) « Comgaaiss, Irvesamens, Clmasilieds 
« Computers and Internet [Xura!] - leterme, WWW. Software. Maltemedin. 
e Education - Univendies, Kl 


e Entertainment (Xtra!) - Cool Laks, Maries, Musis, Humor 

« Gevernmens - 2 1iecstons, Politics (Xaral). Agencies, Law, Milan: 

e Heal LXarni] - Medicine, Dnags, Diseases, 1'aness… 

e Nemsamd Median (Xera!] - Cuerenu venus, Magazines, TV, Newsouoen 
© Recrracden and Sperss CXirai] - Spons. Games. Tove, Ausos, Quwicoss 
© Reference - Libenies, Dictionaries, Phone Numbers 

e Kegbonul - Commuter, Regkoes, U.S, Stars. 

e Science CS, Biology. Astoocmy, Esginsecieg 

© Suchal Schencs - Aufarozukay. Saxhhugy. Esoaauis 


© Sockets aad Culture - Propk, Ervaonmers. Relgson… 


Yakooligans: - Yahoo: Sop - Yahoo! Amemet Ls 
Day Picks - Random Yahoo! Link - Weekdy Picks 


Yahoo! op 20 december 1996. 


Digitaal erfgoed 


In België staan we nog nergens op het vlak van webarchivering. In Neder- 
land daarentegen is er het Depot Nederlandse Elektronische Publicaties, 
dat enkele tientallen terabytes omvat, met online elektronische publica- 
ties en elektronische tijdschriften die onder de hoede vallen van de Ko- 
ninklijke Bibliotheek. De elektronische publicaties worden opgeslagen in 


„kb.nl/dnp/e-depot/e-depot.htmlk In Duitsland ís er in 1999 een archive- 


ringsproject gestart om aanhoudend de sites van de 5 politieke fracties 
te bewaren: het Politisches Internet-Archive 
In Zweden maakt de Koninklijke Bibliotheek sinds 1997 moment- 
opnames van alle sites die op de extensie ‚se eindigen. Van alle beschik- 
bare websites wordt periodiek een snapshot genomen. Dit is intussen acht 
keer gebeurd. Het archief Kulturarw3 is momenteel echter niet publiek 
toegankelijk via internet. 


In het ‘Charter on the Preservation of the Digital Heritage’ van de 
Unesco (15 oktober 2003 - rekent men websites 
expliciet tot ons digitaal erfgoed (arti). Dat hoort ook zo. Misschien 
worden er over enkele jaren wel enkele belangrijke sites opgenomen in 
het werelderfgoed. Historische webmonumenten, online kathedralen! Met 
rondleidingen! Er wachten de gidsen gouden tijden… « 
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